1
汎用GPUアーキテクチャへの進化
AI032Lesson 12
00:00

次のアーキテクチャから NVIDIA GT200 へ移行する際、 FermiアーキテクチャGPU計算の第3世代の誕生を意味しています前世代のアーキテクチャが数学向けにグラフィックス処理ユニットを改造したものだったのに対し、Fermiは GPGPU(汎用GPU) アプリケーションのために完全に設計されたものです。

1. グラフィックス中心から計算中心へ

GT200のようにテクスチャユニットと厳密なデータ並列性に焦点を当てていたのに対し、Fermiは統合されたメモリリクエストパスを導入しました。この変化により 計算的思考開発者は単純な2次元グリッドマッピングから離れ、複雑なC++アルゴリズムの実装へと進むことが可能になりました。

GT200:グラフィックスの進化テクスチャユニットのみ統合キャッシュなし手動共有メモリのみFermi:GPGPU革命統合L2キャッシュL1キャッシュ付きSMIEEE 754-2008 FP64

2. メモリ階層の飛躍

Fermiは本格的な L1/L2キャッシュ階層 および IEEE 754-2008 浮動小数点標準への準拠を導入しました。これにより、研究者は各バイトごとに「スクラッチパッド」メモリ(共有メモリ)を手動で管理する必要がなくなり、不規則なデータ構造や科学的工学に適した倍精度の正確性を実現できるようになりました。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>